Skip to main content

AI Infra 基础入门

系统推理架构

image-20260327212858916

SM 架构

SM 架构解答 image-20260327213251709

HBM 架构

image-20260327213343632

DP/PP/MP/TP

DP 数据并行:每个GPU保存完整的模型副本,处理不同的数据批次 image-20260327195737267 MP 模型并行:将模型切分到不同GPU,每个GPU只存储部分参数 image-20260327195842794 GPU利用率低,存在流水线气泡 PP 流水线并行:结合数据并行和模型并行,将数据分批处理以减少空闲时间。 image-20260327200110691 TP 张量并行:单层计算拆分到多个GPU image-20260327200936942

RMDA

允许机器直接访问另一台机器的内存,无需CPU介入

NCCL 通信库

Moonckae 架构

image-20260327215008621